Prétraitement de grands ensembles de données pour la fouille visuelle
نویسندگان
چکیده
Résumé. Nous présentons une nouvelle approche pour le traitement des ensembles de données de très grande taille en fouille visuelle de données. Les limites de l’approche visuelle concernant le nombre d’individus et le nombre de dimensions sont connues de tous. Pour pouvoir traiter des ensembles de données de grande taille, une solution possible est d’effectuer un prétraitement de l’ensemble de données avant d’appliquer l’algorithme interactif de fouille visuelle. Pour ce faire, nous utilisons la théorie du consensus (avec une affectation visuelle des poids). Nous évaluons les performances de notre nouvelle approche sur des ensembles de données de l’UCI et du Kent Ridge Bio Medical Dataset Repository.
منابع مشابه
SVM et visualisation pour la fouille de grands ensembles de données
Résumé. Nous présentons un algorithme de SVM et des méthodes graphiques pour le traitement de grands ensembles de données. Pour pouvoir traiter de tels ensembles de données, nous utilisons une représentation des données de plus haut niveau (sous forme symbolique). L’algorithme de séparateur à vaste marge (SVM) est adapté pour pouvoir traiter ce nouveau type de données. Nous construisons un nouv...
متن کاملApproche biomimétique coopérative pour la visualisation de grands graphes multidimensionels
Face à la quantité sans cesse grandissante de données stockées, les algorithmes de fouille et de visualisation de données doivent pouvoir être capable de traiter de grandes quantités de données. Une des solutions est d’effectuer un prétraitement des données permettant la réduction de la dimension des données sans perte significative d’informations. L’idée est donc de réduire l’ensemble de descr...
متن کاملUn aperçu de la fouille visuelle de données
Résumé. Nous présentons dans cet article un aperçu de la fouille visuelle de données. Pour commencer, nous situons ce domaine par rapport à d’autres approches et nous en rappelons les principes fondateurs. Ensuite, nous montrons qu’il existe de nombreux points de vue pour aborder les travaux en fouille visuelle de données : les données ou connaissances à visualiser, la tâche à accomplir, la rep...
متن کاملPrétraitement des bases de données de réactions chimiques pour la fouille de schémas de réactions
Résumé. Un grand nombre de réactions chimiques sont aujourd’hui répertoriées dans des bases de données. Les chimistes aimeraient pouvoir fouiller les graphes moléculaires contenus dans ces données pour en extraire des schémas de réactions fréquents. Deux obstacles s’opposent à cela : d’une part la manière dont les chimistes représentent les réactions par des graphes ne permet pas aux techniques...
متن کاملExploration visuelle de données spatiotemporelles imprécises : application en archéologie
Résumé. Dans cet article, nous proposons d’exploiter une technique spécifique d’exploration visuelle d’un ensemble d’objets archéologiques dont les composantes spatiales et temporelles sont représentées par des ensembles flous convexes et normalisés. Pour cela, en nous basant sur la définition de vecteurs multidimensionnels issus de défuzzifications ou de comparaisons entre deux nombres flous, ...
متن کامل